专利摘要:
本発明は、分散ストレージ・システム内のデータの信頼できる格納に関する。分散ストレージ・システム内にデータ・ユニットを格納するための方法およびシステムが開示され、この分散ストレージ・システムは、指定されていないシステム信頼性の複数のストレージ要素と、その複数のストレージ要素を互いに接続する公共ネットワークと、その複数のストレージ要素に関連する複数のストレージ要素信頼性インデックスを測定する信頼性インデックス制御ユニットとを備える。データ・ユニットは、データ・ユニット信頼性インデックスに従ってデータ・ユニットを格納する要求を受信するステップ、およびそのデータ・ユニット信頼性インデックスが達せられるように、少なくとも1つのストレージ要素の中にデータ・ユニットのレプリケートされたコピーを格納するステップの後に続いて、格納される。
公开号:JP2011507114A
申请号:JP2010538387
申请日:2008-11-24
公开日:2011-03-03
发明作者:ウェレン,ジェローン;スメッツ,ロブ,クリティアナス,ヨハネス;ラジャン,ゴヴィンダ,ナラッパ
申请人:アルカテル−ルーセント ユーエスエー インコーポレーテッド;
IPC主号:G06F12-00
专利说明:

[0001] 本発明は、分散ストレージ・システム内のデータの信頼できる格納に関する。]
背景技術

[0002] データの信頼できる格納を提供するために、従来技術において多くのシステムが提案されてきた。そのようなシステムは、テープ、ディスク、フラッシュメモリなどの記憶媒体に関して、またはアクセス速度、携帯性、ストレージサイズ、書き換え能力、および信頼性など技術的特徴に関して、多くの面で異なる。とりわけ、信頼性は、重要な機能であり、ストレージ・システムは、そのような信頼性を実現するのに様々なアプローチを使用する。]
[0003] よく知られたアプローチは、RAID(Redundant Array of Independent Drives)である。RAIDは、複数のハードディスク・ドライブの間でデータを分割し、レプリケートするコンピュータ・データ・ストレージ・スキームを表す包括的用語である。RAIDの様々な設計は、以下の2つの重要な設計目標、すなわち、より高いデータ信頼性、およびより高いI/O(入出力)パフォーマンスを均衡させる、または強調する。RAIDレベルと呼ばれる、いくつかの標準のスキームが、発展している。RAIDは、特殊なハードウェアまたはソフトウェアを使用することによって、物理的ハードディスクを組み合わせて、単一の論理ユニットにする。ハードウェア・ソリューションは、接続されたシステムに自らを単一のハードドライブとして提示するように、しばしば、設計され、さらにオペレーティング・システムは、技術的仕組みを認識していない。ソフトウェア・ソリューションは、通常、オペレーティング・システムにおいて実施され、やはり、RAIDドライブを単一のストレージ・デバイスとしてアプリケーションに提示する。RAIDには以下の3つの重要な概念、すなわち、データを複数のディスクにコピーすることであるミラーリング、複数のディスクにわたってデータを分割することであるストライピング、および問題が検出され、場合により、修正されること(フォールトトレランスとして知られる)を可能にするように冗長なデータが格納される、誤り検査が存在する。異なるRAIDレベルは、システム要件に応じて、これらの技術の1つまたは複数を使用する。RAIDを使用することの主な狙いは、信頼性および速度を向上させることである。RAIDシステムのディスク・ドライブなどの構成要素は、従来、1つのロケーション内に配置される。]
[0004] より高い信頼性のため、とりわけ、障害復旧のため、SAN(ストレージ・エリア・ネットワーク)またはNAS(ネットワーク接続ストレージ)などの分散ストレージ・システムが、導入されている。SANは、遠隔コンピュータ・ストレージ・デバイス、例えば、ディスク・アレイ、テープ・ライブラリ、およびオプティカル・ジュークボックスを、オペレーティング・システムには、これらのデバイスがローカルで接続されているように見えるように、サーバに接続するアーキテクチャである。SANは、ストレージ通信を扱うように特別に設計されたインフラストラクチャであり、さらに記憶媒体への高速で信頼できるアクセスを確実にするファイバ・チャネル・ファブリック・トポロジを、通常、利用する。さらに、SANは、通常、大型の高可用性のディスク・アレイを互いに接続する。その結果、SANは、大企業内で使用される、かなり複雑な技術であり、さらにディスク・ブロック全体の格納およびバックアップのために主に使用される。]
[0005] SANの代替のオプションは、NFS(ネットワーク・ファイル・システム)などのファイル・ベースのプロトコルを使用し、さらにコンピュータ・ネットワークが遠隔ストレージ要素にアクセスすることを可能にするように使用されるNAS(ネットワーク接続ストレージ)である。SANとは反対に、ストレージが遠隔であることがNAS内のユーザに知られている。さらに、アクセス可能なデータ・ユニットの粒度は、はるかに小さく、コンピュータは、ディスク・ブロック全体ではなく、ファイルの部分を要求することができる。]
[0006] 従来技術から知られているストレージ・システムは、通常、指定された仕様を有するディスク・ドライブなどの事前定義されたシステム構成要素から設計され、さらにSANの場合、ファイバ・チャネル・ファブリックなどの専用ネットワークを介して互いに接続される。さらに、これらのストレージ・システムは、通常、事前定義された仕様を満たすように設計され、構築される。フォールト修正機構は別として、そのようなシステムは、ストレージ・システムの構成が動作中に絶えず変更されることはないという点で、主に静的である。さらに、従来技術のシステムは、信頼性要因を使用するのではなく、分散リソースの中に格納するために、単に、データ・ユニットを複数のコピーにレプリケートする。データ・ユニットの可用性の確率の指示を有さないことの欠点は、必要なよりも多くのストレージ・リソースが使用されることである。このことは、データ・ユニットの所望される信頼性を保証するためにストレージ要素の信頼性の知識が全く利用できない場合、レプリケートされるコピーの数が、より多くなる傾向にあるという事実によってもたらされる。さらに、格納されるべき様々なタイプのデータに必要とされる信頼性の度合いに応じて、ストレージ・リソースの効率的な使用を行うことが可能でない。一部のデータ・ユニットは、他のデータ・ユニットと比べて必要な信頼性の度合いがより高い可能性がある。]
[0007] さらに、従来技術のシステムは、信頼性を、通常、機器および電力の障害の純粋な結果として定義し、さらに、一般に、一般的なMTBF(平均故障間隔)分析を使用して信頼性を推定する。そのような信頼性推定方法は、ストレージ機器として、ハードディスク、フラッシュ・ディスク、およびその他などの物理的ストレージ・デバイスを有する、パーソナル・コンピュータ、デジタル・ビデオ・レコーダなどの、自宅、および/またはSME(中小企業)構内に配置された端末装置/ストレージ機器を使用している場合、適用されない。そのようなストレージ機器の信頼性は、従来技術から知られている方法が、パーソナル・コンピュータが手動でオフにされることなどの使用パターンを考慮に入れないので、そのような方法によっては満足の行くように表されない。そのような事例において、ストレージ機器のMTBF値は、ストレージ機器の実際の可用性の正しい状況を伝えない。したがって、そのようなストレージ要素は、規定されたシステム信頼性を全く有さないと言われることが可能である。]
発明が解決しようとする課題

[0008] 本発明は、規定されないシステム信頼性をそれぞれが有する複数のストレージ要素を動的に変更することを備える、信頼できるストレージ・システムを構築することに関する。]
課題を解決するための手段

[0009] 本発明の或る態様によれば、データ・ユニットを格納するための分散ストレージ・システムが開示される。この分散ストレージ・システムは、規定されないシステム信頼性の複数のストレージ要素を備える。例として、そのようなストレージ要素は、住宅用ゲートウェイ、ホーム・コンピュータ、ならびに使用されていない余分の記憶容量を有する他の端末装置などの、多数の比較的信頼性の劣る住宅用機器および/または端末装置であることが可能である。さらに、この複数のストレージ要素は、公共ネットワークを介して互いに接続される。例として、そのような公共ネットワークは、固定ネットワーク事業者のアクセス・ネットワークまたはインターネットであることも可能である。このネットワークは、WLANルータなどの自宅ネットワーキング・デバイス、ならびにDSLモデムまたはOTN(光ネットワーク端末装置)などの住宅用またはビジネス用のアクセス・モデムを備えることが可能である。さらに、このネットワークは、DSLAMまたはGPONOLT(光回線端末装置)などの、事業者側におけるアクセス・マルチプレクサ、ならびにエッジ・ルータおよびコア・ルータを備えることも可能である。]
[0010] さらに、分散ストレージ・システムは、複数のストレージ要素に関連する複数のストレージ要素信頼性インデックスを測定する信頼性インデックス制御手段を備える。ストレージ要素信頼性インデックスを絶えず監視し、さらに/またはストレージ要素信頼性インデックスを複数のストレージ要素に1対1関係で一意に関連付けることが有益であり得る。つまり、ストレージ要素信頼性インデックスは、ストレージ要素のそれぞれに割り当てられて、測定を介して絶えず更新されることが可能である。例として、任意のホーム・コンピュータのディスク・ドライブなどのストレージ要素が、全体的なストレージ・システムに知られている仕様を全く有さない可能性がある。その結果、ストレージ・システムは、この特定のディスク・ドライブにデフォルトのストレージ要素信頼性インデックスを割り当て、このディスク・ドライブの信頼性を測定する。そのような測定は、絶えず実行されることが可能である。ストレージ要素の信頼性は、例えば、ストレージ・システムに知られていない可能性があるストレージ要素の仕様、ストレージ要素の所有者の習慣、ストレージ要素をその他のストレージ要素に接続するネットワークの部分の信頼性などの、多くの要因によって影響される可能性があることに留意されたい。信頼性インデックス制御ユニットによって、これらすべての要因を考慮に入れるストレージ要素信頼性インデックスが決定され、ストレージ要素に関して絶えず更新されることが可能である。より一般的に、ストレージ要素の使用および可用性のパターンを追跡することが有益であり得る。このことは、ストレージ要素信頼性インデックスが、例えば、1日および/または1週間のうちの異なる時間で異なる可能性があり、さらにデバイス所有者の使用パターンを反映する可能性があることを意味する。]
[0011] さらに、分散ストレージ・システムは、所与の、または所望されるデータ・ユニット信頼性インデックスに従ってデータ・ユニットを格納する要求を受信する手段を有する。データ・ユニット信頼性インデックスは、異なるデータ・ユニットに関して異なる可能性があり、さらにデータ・ユニット信頼性インデックスは、各データ・ユニットに関して別々に分散ストレージ・システムのユーザによって事前定義されることが可能である。さらに、ストレージ・ユニット信頼性インデックスと同様に、データ・ユニット信頼性インデックスも、1日および/または1週間の間の異なる時間に関して異なる可能性があり、このため、データ・ユニットのユーザの可用性要件を反映する可能性がある。例として、分散ストレージ・システムのユーザは、或る特定のファイルが99%の信頼性で格納されることを要求することができる。さらに、分散ストレージ・システムは、所望されるデータ・ユニット信頼性インデックスが達せられるように、少なくとも1つのストレージ要素の中にデータ・ユニットのレプリケートされたコピーを格納する手段を有する。所与の時点で利用可能であるストレージ要素に基づき、さらにそれらのストレージ要素の一時的なストレージ要素信頼性インデックスに基づいて、ストレージ・システムは、選択されたストレージ要素の中にデータ・ユニットのいくつかのレプリケートされたコピーを格納する。要求されるレプリケートされたコピーの数、およびそれらのコピーの正確な格納ロケーションは、そのデータ・ユニット信頼性インデックスが達せられるように決定される。例として、99%の信頼性でそのファイルを格納することは、総合ストレージ要素信頼性インデックスが、所望されるデータ・ユニット信頼性インデックス要件を満たしているように、異なる5つのストレージ要素内にそのファイルを格納することを要求する可能性がある。]
[0012] 分散ストレージ・システム内で利用可能なストレージ要素の数、ならびにそれらのストレージ要素に関連するストレージ要素信頼性インデックスは、絶えず変化する可能性があるので、分散ストレージ・システムは、事前定義されたデータ・ユニット信頼性インデックスが、好ましくは、常時、達せられるように、そのデータ・ユニットの達せられたデータ・ユニット信頼性インデックスの進展を絶えず監視し、必要とされる場合、データ・ユニットのレプリケートされたコピーのストレージ・パターンを変更する手段を有することが可能である。]
[0013] 本発明の別の態様によれば、信頼できるストレージ・サービスが、定義される。このサービスは、サービス・プロバイダによって、ストレージ目的およびキャッシング目的でエンド・ユーザまたは中小企業に提供されることが可能である。信頼できるストレージ・システムは、住宅用ゲートウェイ、ホーム・コンピュータ、および余分の記憶容量を有する他の端末装置などの、多数の比較的信頼できない住宅用機器を備えることが可能である。格納されるべきデータ・ユニットをレプリケートすることにより、さらに通常のアクセス・ネットワーク内の分散環境において、それらのレプリケートされたデータ・ユニットを格納することによって、所望される信頼性が達せられるように信頼性が高められることが可能である。信頼性の点から、データ・ユニットのレプリケートされたコピーを、可能な限り互いに遠く離れて、例えば、ネットワーク障害が、それらのコピーのすべてに影響を及ぼさないように、ネットワークの別々の部分に分散させることが有益であり得る。]
[0014] 分散ストレージ・システムは、複数の物理的ストレージ要素を備える。これらの物理的ストレージ要素は、これらのストレージ要素の信頼性、これらのストレージ要素の空いたストレージ・スペース、およびこれらの物理的ストレージ要素のロケーションを示すポインタなどの、いくつかの動作パラメータを介して論理レベルで記述されることが可能である。本発明の以下の態様のいくつかは、これらの物理的ストレージ要素の可能な論理的構成と関係する。]
[0015] 本発明の別の態様によれば、分散ストレージ・システムは、論理レベルで、SRE(ストレージ・リソース要素)と呼ばれる少なくとも1つの標準化されたストレージ要素を備える。各SREは、リソース回復のための2つのタイプの外部インタフェースと、より高いレベルのSREに対する1つのインタフェースと、可能なより低いレベルのSREに対するインタフェースとを有することが可能である。より高いレベルのインタフェースは、以下に説明される、関連するストレージ・ユニット内の利用可能な空いたストレージ・スペース、およびSREの全体的な信頼性インデックスを与える。]
[0016] SREは、SREの空いたストレージ・スペースを全体で構成する少なくとも1つの論理ストレージ・ユニットを備える。各ストレージ・ユニットは、以下の少なくとも3つの情報フィールド、すなわち、ストレージ・ユニットの空いたストレージ・スペースを示すフィールド、ストレージ・ユニットの信頼性インデックス、ならびに物理的ストレージ要素のIPアドレスであることが可能な、ストレージ・ユニットの物理的ロケーションを識別するラベルを保持する。物理的ロケーションのラベルが、ローカルSREのIPアドレスと等しいIPアドレスである場合、ストレージ・ユニットに関して示される空いたストレージは、ローカル・デバイス上、および/または物理的ストレージ要素上で利用可能である。等しいIPアドレスではない場合、IPアドレスは、次のSREノードをポイントする。1つのSRE内に複数のストレージ・ユニットが存在することが可能であり、さらに1つのSREのストレージ・ユニットに関してローカル・ノードと遠隔ノードの混合が存在することが可能である。]
[0017] 本発明の別の態様によれば、各ストレージ・ユニットに関して信頼性インデックスが、定義される。この信頼性インデックスは、ストレージ・ユニット信頼性インデックスと呼ばれ、さらに、この信頼性インデックスは、関係するストレージ・ユニットの現在の信頼性を反映するように絶えず更新されることが可能である。この目的で、適切な測定が、定義され、追跡される。例として、この信頼性インデックスは、1から100までの間の数であることが可能であり、1は、最低の信頼性である。稼動させられる際、すべてのストレージ・ユニットは、1、すなわち、最低の信頼性で初期設定される。或る特定のストレージ・ユニットの信頼性インデックスは、或る特定のストレージ・ユニットが、所与の期間内に参加した約M1の、可能性として100のストレージ・トランザクションに関して、N1の、可能性として1のカウントだけ増加されることが可能である。他方、信頼性インデックスは、その所与の期間内のストレージ・トランザクションの数が、M2未満、可能性として100未満である場合、N2の、可能性として1のカウントだけ低減されることが可能である。このことにより、ストレージ・ユニットの動的信頼性を監視することが可能になる。]
[0018] 本発明の別の態様によれば、ストレージ・ユニット信頼性インデックスは、1日のうちの時間、および/または1週間のうちの曜日などの特定の期間に依存することが可能である。例として、或る期間、例えば、24時間が、00時00分から06時00分まで、06時00分から09時00分まで、および09時00分から12時00分までといった具合に下位時間ユニットに分割されることが可能である。各下位時間ユニットに関してストレージ要素信頼性インデックスが、定義されることが可能であり、さらにそのストレージ要素信頼性インデックスが、その下位時間ユニット内のストレージ・ユニットの可用性に応じて更新されることが可能である。このようにして、ストレージ・ユニットの可用性の確率は、考慮されている各期間に関して反映される。より一般的に、ストレージ要素信頼性インデックスは、ストレージ要素または論理的に関連するストレージ・ユニットの使用パターンおよび/または可用性パターンを反映することが可能である。そのようなパターンは、営業時間や営業外時間などの1日のうちの或る期間、または平日や週末などの1週間のうちの或る期間、ならびに祝日、その他などの他の特定のイベントを考慮に入れることが可能である。ストレージ要素の使用パターンおよび/または可用性パターンの、好ましくは完全な状況を得るために、それらの期間のそれぞれに関して異なるストレージ要素信頼性インデックスが、決定されることが可能である。この情報は、適切なストレージ要素を選択することによって、或るデータ・ユニット信頼性インデックスに関連するデータ・ユニットを格納する際に使用されることが可能である。また、データ・ユニットのアクセス可能性要件に関しても同様のパターンを定義することが、有益であり得る。ユーザは、営業時間中の、または週末および/または祝日だけのデータ・ユニットの可用性を要求することができる。このデータ・ユニット可用性要件は、異なる期間に関連する異なる値でデータ・ユニット信頼性インデックスを定義することによって、反映されることが可能である。その結果、データ・ユニットを格納する際、分散ストレージ・システムは、ストレージ要素信頼性インデックスによって表現される、ストレージ要素の可用性パターンと、データ・ユニット信頼性インデックスによって表現される、データ・ユニットの可用性要件の両方を考慮に入れることができる。]
[0019] 本発明の別の態様によれば、SRM(ストレージ・リソース・マネージャ)が、階層SREのセットとして定義される。各SREは、より高いレベルに対する1つのインタフェースと、より低いレベルに対する複数のインタフェースとを有するので、SREは、SRMと呼ばれる、階層ツリー構造に容易に構成されることが可能である。ツリー構造における各SREは、いくつかが、ローカル・ストレージ・デバイスを参照する一方で、他のいくつかが、より低いレベルの他の遠隔SREを参照する、複数のストレージ・ユニットを備えることが可能である。遠隔SREは、ローカル・ストレージ・ユニットおよび/または他のSREを参照し、ついには、最低のツリー・レベルの最後のSREは、ローカル・ストレージ・デバイスまたはローカル・ストレージ要素だけを備える。SRM内に1つのSREだけしか有さないことが可能であることに留意されたい。]
[0020] 本発明の別の態様によれば、SRMの目的は、外部ユーザに対するストレージ・サービスの外部インタフェースを、SREの小さいセットに限定することである。さらに、SRMの定義は、とりわけ、格納されたデータ・ユニットのレプリケートによって、全体的なストレージ・サービスの信頼性を高めることに役立つはずである。]
[0021] 基本的に、本発明の前述した態様は、多くの有用な仕方で組み合わされることが可能であることに留意されたい。さらに、本発明の開示は、従属請求項における後方参照によって明示的に与えられる請求項組み合わせ以外の請求項組み合わせも範囲に含む、すなわち、請求項は、基本的に、任意の順序で組み合わされることが可能であることに留意されたい。]
[0022] 本発明の利点および特徴は、好ましい実施形態の説明から明白となろう。本発明は、添付の図に概略で示される例示的な実施形態を参照することによって、以下に説明される。]
図面の簡単な説明

[0023] SRE(標準のストレージ要素)の実施形態を示す図である。
SRM(ストレージ・リソース・マネージャ)の実施形態を示す図である。]
実施例

[0024] 図1は、より高いレベルのSREに向う可能性がある上位インタフェース12を備える標準のストレージ要素10の実施形態を示す。このインタフェースにおいて利用可能な情報11は、このSREによって利用可能にされる累積的な空いたストレージ・スペースと、この空いたストレージ・スペースの平均信頼性を備える。この情報は、標準のストレージ要素10の一部であるストレージ・ユニット13、17、18から利用可能な情報から推測される。各ストレージ・ユニットは、少なくとも3つのフィールド、すなわち、利用可能な空いたストレージ・スペース、ストレージ・ユニット信頼性インデックス、ならびに物理的ストレージ・ロケーションをポイントする少なくとも1つのポインタ14、15、19を備える。この物理的ストレージ・ロケーションは、遠隔14、19、例えば、別のSRE内であること、またはローカル15、例えば、ローカルSREの一部であるディスク・ドライブ16内であることが可能である。これらのポインタは、物理的ストレージ・デバイスに関連するIPアドレスとして実施されることが可能である。] 図1
[0025] ストレージ・ユニットから利用可能な情報に基づいて、SREの全体的な空いたストレージ・スペースおよび平均信頼性インデックスを計算する様々な方法が、存在する。1つの可能性は、SREの全体の空いたストレージ・スペースを、SREのストレージ・ユニットの空いたストレージ・スペースの合計として計算することである。同様に、平均SRE信頼性インデックスは、SREのストレージ・ユニット信頼性インデックスの加重平均として計算されることが可能であり、それぞれのストレージ・ユニットの空いたストレージ・スペースが、重みとして使用される。代替として、SRE信頼性インデックスは、SREに関連するストレージ・ユニットの最低のストレージ・ユニット信頼性インデックスであることが可能である。]
[0026] また、ストレージ・ユニットの信頼性インデックスを計算する複数の方法が存在することにも留意されたい。例として、信頼性インデックスは、所与の期間内に実行されることに成功したトランザクションの数の関数とすることが可能である。好ましくは、成功したトランザクションの数が高いことは、成功したトランザクションの数が低いことと比べて、より高い信頼性を示す。そのようなトランザクションは、ストレージ・ユニットの可用性を絶えず、または散発的に試験する試験トランザクション、または通常のデータ・アクセス動作であることが可能である。また、例えば、1日または1週間の異なる時間における異なるユーザ/使用パターンを反映させるために、複数の信頼性インデックスをストレージ・ユニットに関連付けることが有益であり得ることにも留意されたい。より一般的に、各ストレージ・ユニットを、好ましくは、完全なユーザおよび可用性のパターンで記述することが有益であり得る。このことは、ADSL線を介して接続されたパーソナル・コンピュータ上のハードディスクであることが可能なストレージ・ユニットの信頼性が、ハードディスク自体の技術的信頼性だけでなく、1日のうちの或る時間(例えば、午後10時から午前8時まで)にパーソナル・コンピュータをオフにすることが可能な、パーソナル・コンピュータの所有者の実際の使用にも依存することが可能であるので有益であり得る。]
[0027] 前述したとおり、ストレージ要素の意味のある可用性パターンを得るために、1日および/または1週間のうちの様々な期間に関するストレージ要素信頼性インデックスを追跡することが、有益であり得る。同時に、データ・ユニットの好ましくは、特定の可用性要件を反映させるために、1日のうちの様々な期間に関するデータ・ユニット信頼性インデックスに関する様々な値を定義することが有益であり得る。分散ストレージ・システムは、そのような情報を利用することができ、さらにデータ・ユニットの可用性要件、すなわち、データ・ユニット信頼性インデックスと最もよく合致する可用性パターン、すなわち、ストレージ要素信頼性インデックスを有するストレージ要素を選択することによって、データ・ユニットの可用性要件を満たすことができる。また、このマッチング・プロセスは、分散ストレージ・システム内の全体的な使い果たされるストレージ・スペースを最小限に抑えるのに使用されることも可能である。]
[0028] 図2は、上位SRE21と、2つのより低いレベルのSRE23、24とを備えるストレージ・リソース・マネージャ20の実施形態を示す。上位SRE21は、複数のストレージ・ユニットを備え、ストレージ・ユニット1および2は、ポインタ22および25を使用して、SRE24および23をそれぞれポイントする。SRE23は、さらに低いレベルのSREをポイントする複数のストレージ・ユニットを備えるが、SRE24は、さらなる外部SREはポイントしない。図示される事例において、SRE24は、SRE24にローカルである物理的ストレージ・ロケーションをポイントする1つのストレージ・ユニットだけを備える。] 図2
[0029] 或る実施形態において、ストレージ処理デバイスが、要求されたデータ・ユニット信頼性インデックスに従ってデータ・ユニットを分散ストレージ・システム内に格納するために使用される。そのようなストレージ処理デバイスは、信頼性、ならびに分散ストレージ・システム内の利用可能なストレージ・スペースに関して情報を収集することができる。システム内にデータ・ユニットを格納するために、ストレージ処理デバイスは、様々な可能性を有する。一実施形態において、すべてのストレージ・ユニットの空いたストレージ・スペースおよび信頼性インデックスは、ストレージ処理デバイスに知られていることが可能である。そのような事例において、ストレージ処理デバイスは、データ・ユニットの少なくとも1つのコピーを取り出すことに関する全体的な信頼性が、要求されるデータ・ユニット信頼性インデックスより大きいように、データ・ユニットのレプリケートされたコピーを格納するための或る数の適切なストレージ・デバイスを選択する。適切なストレージ・ユニットの選択は、ストレージ・ユニットの使用パターンと、データ・ユニットの可用性要件との間の可能なマッチング活動に依存することが可能であり、さらに当業者に知られている方法に従って行われる。]
[0030] 別の実施形態において、ストレージ処理デバイスは、1つまたは複数のストレージ・リソース・マネージャによって供給された情報だけしか知らない可能性がある。そのような事例において、ストレージ処理デバイスは、所望されるデータ・ユニット信頼性インデックスが達せられるように、要求されるデータ・ユニット信頼性インデックスに従って信頼性要件を全体として満たす1つまたは複数のSRMを選択し、その1つまたは複数のSRM内でデータ・ユニットの格納を要求する。次に、SRMに関連する処理要素が、SRM内でデータ要素をどのように格納すべきか、例えば、いずれのSREが選択されるか、ならびにデータ・ユニットのいくつのレプリケートが格納されるべきかを決定する。]
[0031] 説明される分散ストレージ・ネットワークに固有の、変化するトポロジおよび/または信頼性状況のため、或る特定のデータ・ユニットに関する実際の信頼性を絶えず監視することが要求される可能性があることに留意されたい。実際の信頼性が、要求されるデータ・ユニット信頼性インデックスを下回って低下した場合、ストレージ処理デバイスは、要求される信頼性状況を再確立するために、前述したストレージ活動を繰り返す必要がある可能性がある。つまり、ストレージ処理デバイスは、追加の、さらに/または他のストレージ・デバイスを選択する必要がある可能性があり、さらにストレージ処理デバイスは、データ・ユニットのさらなるレプリケートされたコピーを、それらのストレージ・デバイスの中に格納する必要がある可能性がある。]
[0032] 指定されていないシステム信頼性を有し、公共ネットワークを介して互いに接続された複数のストレージ要素を備える分散ストレージ環境内でデータ・ユニットを格納するための方法およびシステムが、開示されてきた。ストレージ要素の信頼性を絶えず追跡するストレージ要素信頼性インデックスを定義することによって、事前定義された信頼性に応じたデータ・ユニットの格納を可能にする分散ストレージ・システムが、構築されることが可能である。ストレージ要素が利用できないことが、要素障害に起因するか、ストレージ・デバイスが意図的にオフにされたことに起因するかにかかわらない、ストレージ要素の信頼性を推定するための方法が、開示される。]
[0033] この書かれた説明は、最良の様態も含め、本発明を開示するとともに、任意の当業者が、本発明を作成し、使用することを可能にもする例を使用する。本発明は、様々な特定の実施形態に関して説明されてきたが、本発明は、特許請求の範囲の趣旨と範囲に含まれる変形を伴って実施され得ることが、当業者には認識されよう。特に、前述した実施形態の相互排他的ではない特徴が、互いに組み合わされされることが可能である。本発明の特許性のある範囲は、特許請求の範囲によって規定され、さらに当業者に想起される他の例を含むことが可能である。]
权利要求:

請求項1
データ・ユニットを格納するための分散ストレージ・システムであって、指定されていないシステム信頼性の複数のストレージ要素と、前記複数のストレージ要素を互いに接続する公共ネットワークと、前記複数のストレージ要素に関連し、さらに前記複数のストレージ要素の信頼性、および前記複数のストレージ要素を接続する前記公共ネットワークの部分の信頼性を考慮に入れる複数のストレージ要素信頼性インデックスを測定する信頼性インデックス制御手段と、前記データ・ユニットに関するユーザの可用性要件を反映するデータ・ユニット信頼性インデックスに従って前記データ・ユニットを格納する要求を受信する手段と、前記データ・ユニット信頼性インデックスが達せられるように、少なくとも1つのストレージ要素の中に前記データ・ユニットのレプリケートされた複数のコピーを格納する手段とを備え、前記信頼性インデックス制御手段は、新たなストレージ要素の前記ストレージ要素信頼性インデックスをデフォルトの信頼性インデックスで初期設定し、前記ストレージ要素が、所与の期間内に第1の事前定義された数の成功したストレージ・トランザクションに参加した場合、前記ストレージ要素信頼性インデックスを第1の事前定義された値だけ増加し、前記ストレージ要素が、所与の期間内に第2の事前定義された数の成功したストレージ・トランザクションに参加していない場合、前記ストレージ要素信頼性インデックスを第2の事前定義された値だけ減少させるように構成されることによって、前記ストレージ要素信頼性インデックスを計算する分散ストレージ・システム。
請求項2
前記信頼性インデックス制御手段は、前記複数のストレージ要素信頼性インデックスを絶えず測定する分散ストレージ・システムであって、前記複数のストレージ要素信頼性インデックスの変化の影響を受ける前記データ・ユニット信頼性インデックスの進展を絶えず監視する手段を備え、前記格納する手段は、前記データ・ユニット信頼性インデックスが常に達せられることを保証する請求項1に記載の分散ストレージ・システム。
請求項3
指定されていない信頼性の前記ストレージ要素は、パーソナル・コンピュータ、自宅ゲートウェイ、および/またはビデオ・レコーダの内部のストレージ・デバイスを備える請求項1に記載の分散ストレージ・システム。
請求項4
前記ストレージ要素信頼性インデックスは、様々な期間とは無関係に追跡される請求項1に記載の分散ストレージ・システム。
請求項5
前記複数のストレージ要素は、階層ツリー構造に編成される請求項1に記載の分散ストレージ・システム。
請求項6
前記複数のストレージ要素は、標準のストレージ要素の全体的な空いたストレージ・スペースおよび平均信頼性を示す上位インタフェース(12)と、少なくとも1つのストレージ・ユニットの空いたストレージ・スペースおよび信頼性インデックスを示す前記少なくとも1つのストレージ・ユニット(13、18)と、前記ストレージ・ユニット(13、18)から、より低いレベルの標準のストレージ要素(10)または物理ストレージ要素(16)をポイントする少なくとも1つのポインタ(14、15)とを備える前記標準のストレージ要素(10)の論理構造を使用して編成される請求項5に記載の分散ストレージ・システム。
請求項7
前記ポインタは、前記物理ストレージ要素(16)に関連するIPアドレスである請求項6に記載の分散ストレージ・システム。
請求項8
指定されていないシステム信頼性の複数のストレージ要素と、前記複数のストレージ要素を互いに接続する公共ネットワークとを備える分散ストレージ・システム内にデータ・ユニットを格納するための方法であって、前記複数のストレージ要素に関連し、さらに前記複数のストレージ要素の信頼性、および前記複数のストレージ要素を接続する前記公共ネットワークの部分の信頼性を考慮に入れる複数のストレージ要素信頼性インデックスを決定するステップと、データ・ユニット信頼性インデックスに従って前記データ・ユニットを格納する要求を受信し、前記データ・ユニット信頼性インデックスは、前記データ・ユニットに関するユーザの可用性要件を反映するステップと、前記データ・ユニット信頼性インデックスが達せられるように、少なくとも1つのストレージ要素の中に前記データ・ユニットのレプリケートされた複数のコピーを格納するステップとを備え、前記ストレージ要素信頼性インデックスは、新たなストレージ要素の前記ストレージ要素信頼性インデックスをデフォルトの信頼性インデックスで初期設定すること、前記ストレージ要素が、所与の期間内に第1の事前定義された数の成功したストレージ・トランザクションに参加した場合、前記ストレージ要素信頼性インデックスを第1の事前定義された値だけ増加すること、および前記ストレージ要素が、所与の期間内に第2の事前定義された数の成功したストレージ・トランザクションに参加していない場合、前記ストレージ要素信頼性インデックスを第2の事前定義された値だけ減少させることによって決定される方法。
請求項9
前記受信される要求は、前記データ・ユニットに関連する前記データ・ユニット信頼性インデックスを備え、前記格納するステップは、前記複数のストレージ要素信頼性インデックスを取り出すステップと、前記少なくとも1つのストレージ要素の総合ストレージ要素信頼性インデックスが、前記データ・ユニット信頼性インデックスに従って前記要件を満たすように、前記データ・ユニットのレプリケートされたコピーの前記格納のための少なくとも1つのストレージ要素を選択するステップとを備える請求項8に記載の方法。
类似技术:
公开号 | 公开日 | 专利标题
US10416894B2|2019-09-17|Dynamic data set replica management
US10133507B2|2018-11-20|Systems and methods for migrating components in a hierarchical storage network
US20200233589A1|2020-07-23|Systems and methods for storage modeling and costing
US10191675B2|2019-01-29|Methods and system of pooling secondary storage devices
US10824343B2|2020-11-03|Managing access of multiple executing programs to non-local block data storage
AU2014346366B2|2017-09-14|Partition-based data stream processing framework
US9697091B2|2017-07-04|System and method for datacenters disaster recovery
US10691554B2|2020-06-23|Providing access to stored computing snapshots
US9858322B2|2018-01-02|Data stream ingestion and persistence techniques
US9104316B2|2015-08-11|Runtime dynamic performance skew elimination
US9407700B2|2016-08-02|Intelligent discovery of network information from multiple information gathering agents
US9930118B2|2018-03-27|Systems and methods for granular resource management in a storage network
US9262273B2|2016-02-16|Providing executing programs with reliable access to non-local block data storage
US9794135B2|2017-10-17|Managed service for acquisition, storage and consumption of large-scale data streams
US9104741B2|2015-08-11|Method and apparatus for seamless management for disaster recovery
US9501322B2|2016-11-22|Systems and methods for path-based management of virtual servers in storage network environments
US8504741B2|2013-08-06|Systems and methods for performing multi-path storage operations
US9348724B2|2016-05-24|Method and apparatus for maintaining a workload service level on a converged platform
US8423746B2|2013-04-16|Storage system and management method thereof
US9940154B2|2018-04-10|Storage virtual machine relocation
US8112395B2|2012-02-07|Systems and methods for providing a distributed file system utilizing metadata to track information about data stored throughout the system
US7424491B2|2008-09-09|Storage system and control method
AU2018202230A1|2018-04-26|Client-configurable security options for data streams
US7146524B2|2006-12-05|Systems and methods for providing a distributed file system incorporating a virtual hot spare
US9323462B2|2016-04-26|File system snapshot data management in a multi-tier storage environment
同族专利:
公开号 | 公开日
EP2073120A1|2009-06-24|
KR101521079B1|2015-05-18|
KR20100103610A|2010-09-27|
EP2073120B1|2017-09-27|
US8131961B2|2012-03-06|
WO2009077056A2|2009-06-25|
JP5319697B2|2013-10-16|
US20090157991A1|2009-06-18|
CN101465880B|2013-05-29|
CN101465880A|2009-06-24|
WO2009077056A3|2010-04-22|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
2011-08-20| A621| Written request for application examination|Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110819 |
2012-07-11| RD04| Notification of resignation of power of attorney|Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120710 |
2013-02-12| A977| Report on retrieval|Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130212 |
2013-02-20| A131| Notification of reasons for refusal|Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130219 |
2013-06-06| TRDD| Decision of grant or rejection written|
2013-06-14| A01| Written decision to grant a patent or to grant a registration (utility model)|Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130613 |
2013-07-18| A61| First payment of annual fees (during grant procedure)|Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130711 |
2013-07-19| R150| Certificate of patent or registration of utility model|Free format text: JAPANESE INTERMEDIATE CODE: R150 |
2016-07-26| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2017-07-25| R250| Receipt of annual fees|Free format text: JAPANESE INTERMEDIATE CODE: R250 |
2018-07-19| LAPS| Cancellation because of no payment of annual fees|
优先权:
申请号 | 申请日 | 专利标题
[返回顶部]